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(57) Abstract: The invention concerns a voice input system comprising a fixed central unit (1) and a mobile voice interface (2) 
carried by a user, for example in his clothes. The voice interface (2) is used for sound input of voice commands which are transmitted 
after being electronically processed by radio relay channel to the central unit (1). The invention is characterized in that the voice 
interface comprises at least two microphones (3a, 3b, 3c) which interact in the form of a microphone array, thereby enabling part of 
a directional characteristic to be obtained during the sound input and the noise to be greatly reduced. The central unit (1) comprises 
the elements required for voice recognition, for example a processor system, and interfaces (4a, 4b, 4c) for controlling external 
appliances through radio relay channel or via cable. 

[Fortsetzung auf der ndchsten Seite] 



004/044889 A2 i mil ilium u huh urn iinmnin i ii in inn iiiii urn mil mil mi hiiid iiii iiii ii ii 



(84) Bestimmungsstaaten (regionai)i ARIPO-Patent (BW, 
GH, GM, KE, LS, MW, MZ, SD, SL, SZ, TZ, UG, ZM, 
ZW), eurasisches Patent (AM, AZ, BY, KG, KZ, MD, RU, 
TJ, TM), europaisches Patent (AT, BE, BG, CH, CY, CZ, 
DE, DK, EE, ES, FI, FR, GB, GR, HU, EE, IT, LU, MC, 
NL, PT, RO, SE, SI, SK, TR), OAPI-Patent (BF, BJ, CF, 
CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, 
TG). 



VerofTentlicht: 

ohne internationalen Recherchenbericht und erneut zu ver- 
offentlichen nach Erhalt des Berichts 

Zur Erklarung der Zweibuchstaben-Codes und der anderen Ab- 
kiirzungen wird auf die Erklarungen ("Guidance Notes on Co- 
des and Abbreviations") am Anfang jeder reguldren Ausgabe der 
PCT-Gazette verwiesen. 



(57) Zusammenfassung: Beschrieben wind ein Spracheingabesystem, bestehend aus einer stationaren Zentraleinheit (1) und einem 
transportablen, vom Anwender z.B.an der Kleidung mitgefiihrten Sprachinterface (2). Das Sprachinterface (2) dient zur akustischen 
Aufnahme gesprochener Kommandos, die nach elektronischer Aufbereitung drahtlos an die Zentraleinheit (1) iibertragen werden. 
Dabei enthalt das Sprachinterface zwei oder mehr Mikrofone (3a, 3b, 3c), die als Mikrofonarray zusammenwirken, wodurch einer- 
seits eine Richtcharakteristik bei der Schallaufhahme und andererseits eine weitgehende Unterdriickung von Storgerauschen ermog- 
licht wird. Die Zentraleinheit (1) enthalt die Komponenten der Spracherkennung, Z.B. Prozessorsystem, und Schnittstellen (4a, 4b, 
4c), uber die externe Gerate drahtlos oder uber Kabel gesteuert werden. 
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Spracheingabe- Interface 

Die Erfindung betrifft Systeme, bei denen das Sprechen eines 
Anwenders aufgenommen und als Signal weitergeleitet wird. 
5 Insbesondere betrifft die Erfindung Systeme, bei denen liber 
eine Spracheingabe Funktionen ausgelost oder gesteuert wer- 
den. 

Systeme mit Spracheingabe und Sprachsteuerung sind bekannt . 
So sind beispielsweise bei Computern Eingaben - Diktieren von 
Text en oder Steuerbef ehle - per Sprache moglich. In der Medi- 
zintechnik exist ieren Gerate, die zur Entlastung bei schwie- 
rigen Eingriffen durch Sprachkommandos des Arztes gesteuert 
werden konnen. Auch im Sicherheitsbereich werden Vorrichtun- 
gen eingesetzt, die beispielsweise eine verschlossene Tur se- 
lektiv nur auf Sprache ingaben autorisierter Personen offnen. 

Alle derartigen System erfordern fur das Erkennen der sprach- 
lichen Information bzw. Kommandos eine hohe akustische Quali- 
20 tat der Spracheingabe. Besonders storend wirkt sich bei- 
spielsweise ein zu groSer Abstand zwischen Mikrofon und Mund 
des Sprechers aus (zu geringe Eingabelautstarke) . In gleicher 
Weise wirkt ein Sprechen in eine Richtung, die nicht im 
Hauptaufnahmebereich des Mikrofons liegt. Auch eine relativ 
25 nahe Distanz zum Mikrofon kann sich negativ auswirken, da in 
diesem Fall zum einen leicht eine Ubersteuerung des Aufnahme- 
pegels auftreten kann, zum anderen durch den Atmen des Spre- 
chers zusatzlich starke akustische Storgerausche (Windgerau- 
sche) entstehen konnen. Grundsatzlich wirkt sich auch ein ho- 
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her Gerauschpegel aus der Umgebung sehr storend auf die Er- 
kennungsgenauigkeit des Spracheingabesystems aus . 

Um diese bekannten Probleme zu losen, werden beispielsweise 
5 fur Computersysteme mit Texteingabe Mikrof onbiigel eingesetzt, 
die (zumeist in Verbindung mit einem Kopfhorer oder Ohrhorer) 
vom Anwender am Kopf getragen werden. Bei entsprechender Aus- 
richtung des Bugels befindet sich das Auf nahmemikrofon auch 
bei Kopfbewegungen stets in gleichem Abstand nahe am Mund des 

10 Sprechers. Nachteilig ist dabei die eingeschrankte Bewegungs- 
freiheit aufgrund der ublichen Kabel verbindung zum Computer. 
Auch konnen Storgerausche durch Bewegungen des Kabels auftre- 
ten. Zudem empfinden viele Personen das Tragen von Kopf- oder 
Ohrhorern, insbesondere bei langerer Anwendung, als unange- 

15 nehm. 

Alternativ werden daher auch Mikrof one mit stationarer Posi- 
tion, z.B. Tischmikrof on mit Stativ oder integriert in das 
Gehause (PC, Laptop) oder befestigt am Gerat (Turrahmen bei 

20 Sicherungsfunktion) verwendet. Nachteilig ist dabei die auf 
einen bestimmten Raumbereich vor dem Mikrofon beschrankte 
Aufnahmezone . Dies erfordert vom Anwender die Einhaltung ei- 
ner definierte Position, Korperhaltung, Sprechrichtung usw., 
d.h. es besteht praktisch keine Bewegungsf reiheit wahrend der 

2 5 Spracheingabe . 

Ausgehend von diesem Stand der Technik liegt der vorliegenden 
Erfindung die Aufgabe zugrunde, ein verbessertes System zur 
Spracheingabe zu entwickeln, das die genannten Nachteile 
30 weitgehend uberwindet und zusatzliche Vorteile aufweist. 



Diese Aufgabe wird bei einer Vorrichtung mit den Merkmalen 
des Oberbegriffs des Anspruchs 1 gelost durch die kennzeich- 
nenden Merkmale des Anspruchs 1. Weitere Einzelheiten der Er- 
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finciung und Vorziige verschiedener Ausf uhrungsf ormen sind Ge- 
genstand der Merkmale der Unteranspruche . 

Die erf indungsgemaSe Vorrichtung wird im folgenden anhand ei- 
ner bevorzugten Ausf uhrungsf orm beschrieben, wobei Bezug ge- 
nommen wird auf die Abbildungen und den darin aufgefuhrten 
Bezugszif f ern . 

Dabei zeigen: 

Fig. 1 das erf indungsgemafie Spracheingabesystem aus 
Zentraleinheit und separaten Sprachinterf ace 

Fig. 2 eine schematische Darstellung einer Ausf uhrungsf orm 
15 des Sprachinterf aces 

Fig. 3 Richtcharakteristik des vom Anwender mitgef uhrten 
Sprachinterf aces 

20 Die vorliegende Erfindung zielt darauf ab # Komfort und Quali- 
tat bei Spracheingabesystemen deutlich zu verbessern. Dabei 
soil ein mit Mikrofonen ausgestattetes transportables Sprach- 
interf ace vom Anwender standig getragen werden, wodurch ihm 
letztlich ein universeller Sprachzugang zu verschiedenen Sys- 

25 temen ermoglicht wird. Durch Verwendung von Mikrof onarrays 

kann auch bei verschiedenen akustischen Umgebungen eine hohe 
Eingabequalitat gegeniiber Storgerauschen erreicht werden. Da- 
mit ist es auch als Spracheingabesystem in Fahrzeugen geeig- 
net, da Storungen durch Fahrgerausche oder Echoeffekte bei 

3 0 Lautsprecherausgaben vom Mikrof onarray vermindert werden. Fur 
ein standig zu tragenden Sprachinterf aces ist es wichtig, 
dass es klein und leicht ist und - je nach auSerer Gestaltung 
- beispielsweise als Schmuck oder Identif ikationssymbol ak- 
zeptiert wird. 
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Fig. 1 zeigt als Ubersicht die zusammenwirkenden Komponenten 
des Spracheingabesystems . Das Sprachinterf ace (2) ist als mo- 
bile Einheit ausgefiihrt und wird vom Anwender, z.B. an der 
5 Kleidung, getragen. Es ubertragt die akustisch auf genommenen 
Sprachsignale drahtlos, z.B. per Infrarot- oder Funkverbin- 
dung an die Zentraleinheit (1) , in der die Signale weiter 
aufbereitet werden und diverse Steuerfunktionen ausgelost 
we r den. 

10 

Zur Gewahrleistung einer hohen Qualitat der Sprachauf nahme 
weist das Sprachinterf ace (2) zwei oder mehrere Mikrofone 
(3a, 3b, 3c) auf. Eine solche Anordnung ist in Fig. 2 vergro- 
Sert dargestellt. 

15 

Die verwendeten Mikrofone (3a, 3b, 3c) konnen individuelle 
Richtcharakteristiken (Niere, Hyperniere, Acht) aufweisen. 
Damit wird bereits durch eine vordef inierte Mikrof on-Richt- 
charakteristik Schall vorrangig aus einer bestimmten Zone 

2 0 verstarkt auf genommen . 

Die hier erf indungsgemaS vorgeschlagene Verwendung eines 
kleinen Mikrof onsystems mit zwei oder mehr Mikrofonen erlaubt 
die Bildung von Mikrof onarrays . Durch das Zusammenwirken der 

25 Mikrofone in einem solchen Mikrof onarray kann - in Verbindung 
mit einer fur solche Arrays ublichen elektronischen Aufberei- 
tung - die Qualitat der Spracheingabe wesentlich verbessert 
werden: So kann - uber die oben erwahnte, unveranderliche 
Mikrof on-Richtcharakteristik hinaus - eine spezielle raumli- 

30 che Richtwirkung des Mikrof onarrays eingestellt werden, d.h. 
akustische Signale werden vorrangig aus einem gewiinschten 
Raumbereich (Mundpartie des Anwenders) auf genommen. Durch 
diese zusatzliche Array-Richtcharakteristik werden Nebenge- 
rausche aus anderen Bereichen der Umgebung weiter unterdruckt 

3 5 bzw. konnen elektronisch weitgehend herausgef iltert werden. 
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Die Array-Richtcharakteristik ergibt sich aus der Anzahl und 
geometrischer Anordnung der Mikrofone. Im einfachsten Fall 
werden zwei Mikrofone verwendet (Minimalkonf iguration) . Vor- 
5 zugsweise ist das Interface jedoch mit drei (wie in Fig. 2 

dargestellt) oder mehr Mikrofonen ausgestattet , die eine bes- 
sere Richtwirkung und Storschallunterdruckung ermoglichen. Es 
gibt zwei grundsatzliche Mikrof on-Array-Anordnungen: ^broad- 
side" und "end-fire". Bei "broad-side" liegt die Richtwirkung 

10 senkrecht auf der gedachten Verbindungslinie der Mikrofone, 

bei "end-fire" liegt die Richtwirkung in Richtung der gedach- 
ten Verbindungslinie der Mikrofone. Das Ausgangssignal eines 
"broad- side" Arrays ergibt sich in einfachster Form aus der 
Summation der einzelnen Signale, beim "end- fire" Array aus 

15 der Differenz, wobei auch Lauf zeitkorrekturen eingesetzt wer- 
den. 

Die Richtwirkung des Mikrof onarrays kann durch weitere MaS- 
nahmen verandert und damit eine adaptive Richtcharakteristik 

2 0 erreicht werden. Dabei werden die einzelnen Mikrof onsignale 

nicht einfach addiert oder subtrahiert, sondern durch spe- 
zielle Signalverarbeitungsalgorithmen so ausgewertet, dass 
akustische Signale aus einer Hauptrichtung verstarkt empfan- 
gen werden und Nebengerausche aus anderen Richtungen abge- 
25 schwacht aufgenommen werden. Die Lage der Hauptrichtung ist 
dabei veranderbar, d.h. sie kann adaptiv an ein sich andern- 
des akustisches Szenario angepaSt werden. Dabei kann bei- 
spielsweise die Art und Weise, wie das Signal der Hauptrich- 
tung bewertet und maximiert wird und gleichzeitig Storgerau- 

3 0 sche aus Nebenrichtungen minimiert werden, in einem Fehler- 

kriterium festgelegt sein. Algorithmen zur Erzeugung einer 
adaptiven Richtwirkung sind unter dem Begriff "Beamf orming" 
bekannt . Verbreitete Algorithmen sind z.B. der Jim-Griffith 
Beamf ormer oder der "Frost" Beamf ormer. 
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Durch Veranderung entsprechender Parameter kann die Haupt- 
richtung beim "Beamf orming" so variiert werden, dass sie mit 
der Richtung aus der gesprochen wird ubereinstimmt , was einer 
aktiven Sprecherortung entspricht. Eine einfache Moglichkeit 
5 die Sprechrichtung zu bestimmen ist z.B. die Lauf zeitschat- 
zung zwischen zwei Empf angssignalen zweier Mikrofone. Wird 
die Kreuzkorrelation zwischen den beiden Werten errechnet, so 
ergibt sich der maximale Kreuzkorrelat ions -Wert bei der Lauf- 
zeitverschiebung beider Signale. Wird nun die diese Laufzeit 

10 zur Verzogerung des einen Signals eingesetzt, so sind die 

beiden Signale wieder gleichphasig . Damit ist die Hauptrich- 
tung in die aktuelle Sprechrichtung eingestellt. Wird die 
Lauf zeitschatzung und Korrektur wiederholt durchgef uhrt , so 
wird einer Relativbewegung des Sprechers adaptiv gefolgt. Da- 

15 bei ist es vorteilhaft fur die Sprecherortung nur einen zuvor 
festgelegten Raumsektor zuzulassen. Dazu ist es erf orderlich, 
die Mikrof onanordnung grob in einer gewissen Richtung zum 
Mund des Sprechers anzubringen, z.B. am Kleidungsstuck des 
Sprechers . 

20 

Der Mund des Anwenders kann sich dann innerhalb des festge- 
legten Raumsektors gegenuber der Position des Sprachinter- 
faces (2) frei bewegen, die Sprecherortung wird ihm folgen. 
Wird eine Signalquelle aufierhalb des festgelegten Raumsektors 
25 detektiert, dann wird diese als Storung identif iziert (bei- 
spielsweise eine Lautsprecherausgabe) . Der Beamf orming-Algo- 
rithmus kann sich nun speziell auf den Schall aus dieser 
Richtung im Sinne eine Minimierung des Storsignals einstel- 
len. Dies lafit auch eine wirksame Echokompensation zu. 

30 

Fig. 3 zeigt beispielhaft ein kleines Mikrof onsystem aus zwei 
einzelnen Mikrofonen mit einer eingepragten Richtcharakteris- 
tik die rechts am Mund des Sprechers vorbei gerichtet ist. 
Die Mikrofone sind hier an der oberen Kante eines kleinen Ge- 
35 hauses angebracht . Der Array-Typ ist "broad-side", d.h. die 
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Richtwirkung des Arrays ist senkrecht zur Kante des Gehauses 
nach oben gerichtet. Die adaptive Richtwirkung liber Beamfor- 
ming-Algorithmen sorgt dafur, dass die wirksame Richtcharak- 
teristik auf die Quelle, den Mund des Anwenders ausgerichtet 
5 ist . 

Mikrofone mit hoher Qualitat sind als Miniaturausf tihrung (bis 
herab zu MillimetergroSe) verfugbar. Ebenso sind drahtlose 
Ubertragungseinrichtungen, z.B. Infrarot- oder Funksender, 

10 mit heutiger Technik (z.B. als SMD oder IC) extrem klein her- 
stellbar. Zur Stromversorgung genugt eine kleine Batterie 
bzw. Akkumulator (z.B, Knopf zelle) , da nur ein geringer Ener- 
gieverbrauch entsteht . Damit ist die Integration aller Kompo- 
nenten des Sprachinterf aces (2) zu einer kleinen und auch 

15 aufgrund des sehr geringen Gewichts bequem tragbaren Einheit 
moglich. Beispielsweise kann ein solches miniaturisiertes 
Sprachinterf ace (2) als Ansteckvorrichtung bzw. Clip an der 
Kleidung befestigt werden (vergleichbar mit einer Brosche) 
oder an einem Armband oder einer Halskette mitgefuhrt werden. 

20 

In einer ersten Ausf uhrungsf orm werden die jeweiligen Signale 
der einzelnen Mikrofone des Arrays parallel zur Zentralein- 
heit ubermittelt. Dort werden dann diese Signale elektronisch 
weiter verarbeitet, urn Richtungscharakteristik und Storge- 

2 5 rauschunterdruckung einzustellen . Diese Funktionen konnen al~ 

ternativ - zumindest teilweise - auch bereits im Sprachinter- 
face selbst erfolgen. In dem Sprachinterf ace (2) sind dann 
entsprechende elektronische Schaltkreise integriert, die fur 
eine erste Signalauf bereitung sorgen. So kann beispielsweise 

3 0 auch der jeweilige Mikrof on-Auf nahmepegel durch automatische 

Verstarkungsregelungen (Automatic-Gain-Control ) angepaSt wer- 
den oder durch entsprechende Filter bestimmte Frequenzanteile 
abgeschwacht oder verstarkt werden. 
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Wie in Figur 2 dargestellt kann das Eingabeinterf ace (2) auch 
Komponenten fur eine Umwandlung analoger in digitale Signale 
aufweisen. Die Ubertragung digitaler Signale zur Zentralein- 
heit (1) bietet mit den heute verfugbaren Sende/Empf angs- 
5 techniken einen sehr hohen Inf ormationsf luss bei minimaler 
Storanf alligkeit . 

Das Sprachinterf ace (2) kann mit einer Aktivierungstaste oder 
Sensorflache ausgestattet werden, deren Betatigung/Beriihrung 
10 eine Spracherkennung aktiviert, beispielsweise durch Ubertra- 
gung eines entsprechenden Signals an die Zentraleinheit (1) . 
Alternativ kann eine solche Aktivierung auch durch Sprachein- 
gabe eines Schlusselwortes erfolgen. 

In einer erweiterten Ausf uhrungsf orm weist das Sprachinter- 
face (2) zusatzlich eine Empf angseinrichtung auf (nicht dar- 
gestellt) , die drahtlos ubermittelte Steuersignale von der 
Zentraleinheit (1) empfangen kann. Damit kann die Charakte- 
ristik der Sprachauf nahme (Kombination der Mikrofone zum Ar- 
ray, Verstarkung, Frequenzf ilter usw.) im Sprachinterf ace (2) 
durch die Zentraleinheit (1) verandert werden. Weiterhin kann 
die Zentraleinheit (1) uber die Empf angseinrichtung dem Be- 
nutzer auch ein akustisches oder optisches Signal ubermit- 
teln, beispielsweise als "'Feedback^ fur erfolgreich ausgelos- 
te Aktionen aber auch Fehlf unktionen (Kommando nicht erkannt 
oder - z.B. wegen Storung der Schnittstellen - nicht ausfiihr- 
bare Funktion) oder zur Anforderung weiterer Eingaben (Kom- 
mando unvollstandig) . Als Signalgeber konnen z.B. verschie- 
denfarbige LED's oder piezokeramische Kleinlautsprecher in 
das Spracheingabeinterf ace (2) integriert werden. Auch ist es 
denkbar, eine Eingabeeinheit , beispielsweise Tastatur, zur 
Eingabe von Inf ormationen in Text form vorzusehen. 

Die Zentraleinheit (1) empfangt die drahtlos ubermittelten 
35 Signale des Sprachinterf aces (2) und wertet sie fur eine 
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Spracherkennung aus. Auch die verschiedenen erf orderlichen 
Kalkulationen zur Sprecherortung und adaptiven Anpassung der 
Richtungscharakteristik des Mikrof onarrays konnen ganz oder 
teilweise in der Zentraleinheit (1) erfolgen. Die fur eine 
zuverlassige und schnelle Signalverarbeitung und Spracherken- 
nung erforderliche Prozessorleistung kann beispielsweise liber 
ein ubliches Computer- bzw. Mikroprozessorsystem zur Verfii- 
gung gestellt werden, das vorzugsweise Teil der Zentralein- 
heit (1) ist. Damit konnen anwenderspezif ische Konf iguratio- 
nen ( Arr aycharakt er i st ik , Sprache igenhe i t en , spe z i el 1 e 
Schalt/Steuerkommandos usw.) jederzeit neu einprogrammiert 
werden - 

Da die Zentraleinheit (1) getrennt vom Sprachinterf ace (2) - 
z.B. integriert in Gerate (TV, Telef onanlage , PC-System usw.) 
- stationar ausgebildet ist, entstehen auch bei leistungsfa- 
higer elektronischer und EDV-technischer Ausstattung keine 
besonderen Probleme oder Einschrankungen bzgl . Stromversor- 
gung, Volumen, Gewicht oder auch Kuhlung warmeproduzierender 
Komponenten (Prozessor) . 

Die Zentraleinheit (1) ist so konf iguriert , dass erkannte 
Kommandos fiber integrierte Schnittstellen (4a, 4b, 4c) ent- 
sprechende Schalt- und Steuerfunktionen auslosen, auf die 
verschiedene externe Gerate reagieren. 

Hierzu konnen beispielsweise Telef onsysteme, Audio- und Vi- 
deogerate gehoren, aber auch eine Vielzahl elektrisch/elek- 
tronisch steuerbarer Hausgerate (Licht, Heizung, Klimaanlage, 
Jalousien, Turoffner u.v.a.m) . Bei Einsatz in einem Fahrzeug 
konnen entsprechend Funktionen des Fahrzeugs (Navigations sys- 
tem, Musikanlage, Klima, Scheinwerf er, Scheibenwischer usw. ) 
gesteuert werden. 
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Die Ubertragung der Steuersignale der Schnittstellen (4a, 4b, 
4c) zu den verschiedenen externen Geraten kann ihrerseits 
wieder drahtlos (IR, Funk) oder auch (z.B. bei Einsatz im 
Fahrzeug) mittels Kabelverbindung erfolgen. 

Die erf indungsgemaSe Spracheingabevorrichtung bietet dem An- 
wender vollige Bewegungsf reiheit (auch liber groSere Distanz 
z.B. verschiedene Raume/Etagen eines Hauses) . Hinzu kommt ein 
optimaler Tragekomf ort , da das Sprachinterf ace (2) nicht am 
Kopf befestigt werden muK. Durch das kleine Eigengewicht und 
die geringe GroSe (insbesondere als Miniaturausf uhrung) ent- 
steht durch das Sprachinterf ace keinerlei Behinderung, so 
dass es - vergleichbar zu einer Armbanduhr - fur ein dauer- 
haf tes Tragen geeignet ist . 

Verschiedene Gerate bzw. Funktionen an unterschiedlichen Or- 
ten konnen mit ein und demselben Sprachinterf ace gesteuert 
werden (Multimediaeinrichtungen, Hausgerate , Fahrzeugf unktio- 
nen, Buro-PC, Sicherheitsanwendungen, usw.), da auch mehrere 
Zentraleinheiten an unterschiedlichen Standorten (z.B. Pri- 
vatraume, Fahrzeug, Arbeitsbereich) so eingestellt werden 
konnen, dass sie auf das gleiche Sprachinterf ace bzw. den 
gleichen Anwender reagieren. 

Besonders vorteilhaft ist die hohe Flexibilitat des vorge- 
stellten Spracheingabesystems . So ermoglicht das Mikrofonar- 
ray eine aktive - je nach Ausf uhrung auch automatische - Jus- 
tierung auf veranderte Gegebenheiten, wie z.B. andere Raum- 
akustik oder Befestigung des Sprachinterf aces an anderer 
Stelle der Kleidung (andere Sprechrichtung) oder auch ein 
neuer Anwender (eigene Sprechweise) . Durch Programmierung der 
Zentraleinheit kann das Spracheingabe system flexibel an die 
jeweiligen Steuer und Regelungsauf gaben angepaSt werden. 
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Grundsatzlich bietet das erf indungsgemaSe System den Vorteil, 
dass das sehr kleine und leichte Sprachinterf ace vom Anwender 
standig getragen werden kann. Ein Benutzer kanii es ohne Be- 
hinderung auch bei sich fiihren, wenn er seinen Auf enthaltsort 
andert, z.B. in sein Auto einsteigt . Durch das Mikrof onarray 
und damit verbundenen Richtungswirkung der Schallauf nahme er- 
gibt sich auch bei ungiinstigen Umstanden (Umgebungsgerausche) 
eine hohe akustische Sprachauf nahmequal it at . Die auf wandigen 
Prozesse der Sprachauf bereitung konnen liber entsprechend 
leistungsf ahige Komponenten in der Zentraleinheit mit sehr 
hoher Erkennungssicherheit erfolgen. Dabei kann die Spracher- 
kennung individuell auf einen oder mehrere Anwender justiert 
werden, z.B. fur eine Funktionsbeschrankung nur auf vorbe- 
stimmte, autorisierte Person (en) . Die Ansteuerung verschiede- 
ner Gerate uber entsprechende Schnittstellen ist frei konfi- 
gurierbar und kann nach individuellen Wiinschen fur verschie- 
denste Anwendungszwecke modifiziert und erweitert werden. 
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Patent ansprtlche 
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Spracheingabesystem aus stationarer Zentraleinheit (1) 
und transportablem Sprachinterf ace (2), wobei 
die Zentraleinheit (1) Mittel zum Empfang drahtlos iiber- 
mittelter Sprachsignale und Mittel fur eine Auswertung 
dieser Sprachsignale zur Erkennung gesprochener Worte 
aufweist, sowie Schnittstellen (4a, 4b, 4c) , die in Ab- 
hangigkeit von erkannten Worten Schalt- bzw. Regelsignale 
erzeugen und an externe Gerate ubertragen und wobei 
das Sprachinterf ace (2) zwei oder mehr Mikrofone (3a, 3b, 
3c) aufweist, die als Mikrof onarray kombiniert sind, so- 
wie Mittel zur drahtlosen Ubertragung der vom Mikrofonar- 
ray generierten Signale an die Zentraleinheit (1) . 

Spracheingabesystem nach Anspruch 1, 
dadurch gekennzeichnet, 
dass das Sprachinterf ace (2) Mittel zur elektronischen 
Aufbereitung der von den Mikrof onen (3a, 3b, 3c) des Mik- 
rof onarrays erzeugten Signale aufweist. 

Spracheingabsystem nach Anspruch 2, 

dadurch gekennzeichnet, 

dass die elektronische Aufbereitung eine Veranderung der 

jeweiligen Signalpegel (Verstarkung, Dampfung, AGC) und/ 

oder Frequenzanteile (Hohen-, Tiefen-, Band-Filter) und/ 

oder der jeweiligen Signalphasen bewirkt. 
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4 . Spracheingabesystem nach einem der Anspriiche 2 oder 3 , 
dadurch gekennzeichnet, 

dass die Mitt el zur elektronischen Aufbereitung auch Mit- 
5 tel zur Umwandlung analoger in digitale Signale beinhal- 

ten. 

5. Spracheingabesystem nach einem der Anspriiche 1 bis 4, 
dadurch gekennzeichnet, 

10 dass das Sprachinterf ace (2) Mittel zum Empfang drahtlos 

(z.B. IR, Funk) von der Zentraleinheit (1) ubermittelter 
Signale aufweist. 

6. Spracheingabesystem nach Anspruch 2, 3 oder 4, 
15 dadurch gekennzeichnet, 

dass das Sprachinterf ace (2) Mittel zum Empfang drahtlos 
(z.B. IR, Funk) von der Zentraleinheit (1) ubermittelter 
Steuersignale aufweist, mit denen die Zentraleinheit (1) 
die Mittel zur elektronischen Aufbereitung des Sprachin- 

2 0 terfaces (2) beeinflussen kann. 

7. Spracheingabesystem nach einem der Anspriiche 1 bis 6, 
dadurch gekennzeichnet, 

dass die Mittel der Zentraleinheit (1) zur Auswertung der 
25 Sprachsignale als Prozessorsystem (EDV) ausgefxihrt sind. 

8. Spracheingabesystem nach Anspruch 1, 
dadurch gekennzeichnet, 

dass das Prozessorsystem Anwender-bezogene Daten (z.B. 

3 0 individuelle Sprachkommandos , Sprachparameter) speichert 

und zur Auswertung der Sprachsignale und/oder zur Erzeu- 
gung individuell zugeordneter Steuersignale einbezieht. 
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9. Spracheingabesystem nach einem der Anspriiche 1 bis 8, 
dadurch gekennzeichnet, 

dass das Mikrof on-Array (3a, 3b, 3c) eine Richtcharakte- 
ristik in der Weise aufweist, dass Schall vorrangig aus 
5 einer Richtung auf genommen wird. 

10. Spracheingabesystem nach Anspruch 9, 
dadurch gekennzeichnet, 

dass die Richtcharakteristik durch Aufbereitung der von 
0 den Mikrof onen (3a, 3b, 3c) des Mikrof onarrays erzeugten 

Signale uber Beamf orming-Algorithmen (z.B. Griffith-, 
Frost - Beamf ormer) verandert werden kann. 

11. Spracheingabesystem nach Anspruch 10, 

5 dadurch gekennzeichnet, 

dass die Richtcharakteristik in der Weise verandert wird, 
dass sie einer raumlichen Verlagerung der Schallquelle 
folgt (Sprechernachfuhrung) . 

0 12. Spracheingabesystem nach einem der Anspriiche 1 bis 11 
dadurch gekennzeichnet, 
dass die einzelnen Mikrof one (3a, 3b, 3c) des Arrays eine 
Richtcharakteristik (z.B. Niere, Acht) aufweisen. 
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